Floormod

逐元素计算两个输入张量的 floor-modulus。

\[\text{output}_i = \text{input0}_i - \lfloor \frac{\text{input0}_i}{\text{input1}_i} \rfloor \cdot \text{input1}_i\]

其中 \(\lfloor \cdot \rfloor\) 表示向下取整 (floor) 操作。

输入:
  • input0 - 第一个输入张量(被除数)的数据地址。

  • input1 - 第二个输入张量(除数)的数据地址。

  • size - 输入张量的总元素数量。

  • core_mask - 核掩码。

输出:
  • output - 输出张量的数据地址,其大小与输入张量相同。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持fp32

  • MT7004 支持fp16, fp32

共享存储版本:

void fp_floormod_s(float *input0, float *input1, float *output, int size, int core_mask)
void hp_floormod_s(half *input0, half *input1, half *output, int size, int core_mask)
void dp_floormod_s(double *input0, double *input1, double *output, int size, int core_mask)

C调用示例:

 1//FT78NE示例
 2#include <stdio.h>
 3#include <floormod.h>
 4int main(int argc, char* argv[]) {
 5    float *input0 = (float *)0xA0000000;    // input0 在DDR空间
 6    float *input1 = (float *)0xB0000000;    // input1
 7    float *output = (float *)0xC0000000;    // output
 8
 9    int size = 4096;
10    int core_mask = 0xff;
11
12    fp_floormod_s(input0, input1, output, size, core_mask);
13    return 0;
14}

私有存储版本:

void fp_floormod_p(float *input0, float *input1, float *output, int size)
void hp_floormod_p(half *input0, half *input1, half *output, int size)
void dp_floormod_p(double *input0, double *input1, double *output, int size)

C调用示例:

 1//FT78NE示例
 2#include <stdio.h>
 3#include <floormod.h>
 4int main(int argc, char* argv[]) {
 5    float *input0 = (float *)0x10000000;    // input0 在L2空间
 6    float *input1 = (float *)0x11000000;    // input1
 7    float *output = (float *)0x12000000;    // output
 8
 9    int size = 1024;
10
11    fp_floormod_p(input0, input1, output, size);
12    return 0;
13}